# -*- coding: utf-8 -*-

import os, re, jieba
import nltk
import jieba.posseg as pseg

path = os.path.dirname(os.path.realpath(__file__))
jieba.load_userdict(path+"/dict.txt")

f = u'''招聘时间：2016年12月16日10：00 招聘地点：花江校区5教103教室
校园招聘简章
公司简介： 广西成吉思建筑智能工程有限公司是一家集建筑智能化设计与施工一体的综合性智能建设单位，是具有广西区建设厅核发的建筑智能化专业承包资质、安全生产许可证的企业。广西成吉思建筑智能工程有限公司是广西领先的增长最快的智能化解决方案提供商之一。以满足客户需求为目标，为客户提供创新性、个性化的产品和服务，构建安全，舒适，高效、智能的现代化建筑物。
公司拥有齐全、精良的建筑智能工程施工装备，有98人的管理团队及相关专业施工队伍，管理层有工程技术人员52人(其中高级工程师3人，一级建造师2人，二级建造师10人, 工程师10人，助理工程师35人)，智能化造价人员6人。伴随公司成长的，是一批能适应现代化建筑智能建设施工科技发展行业的技术骨干和管理人员。
作为拥有智能建筑行业双资质(智能建筑设计资质、建筑智能化工程专业承包资质)的综合解决方案提供商，多年来为国内不同类型的客户提供了专业、优质的设计、施工服务，使成吉思建筑智能成为建筑智能化领域具有强大影响力的品牌之一。
凭借丰富的产品服务经验，优秀的技术团队，完善的服务网络，科学的项目管理，以及与业内众多领先技术厂商的紧密合作，为用户提供规范化、个性化、专业化的服务，成为了业内公认的、可信赖的顾问。
我们将解决方案定位于商务与科技完美结合的动态环境中，从而为客户提供高质量的服务，满足客户在规模、效率、质量、专业能力等全方位的要求，帮助客户勾画并实现技术驱动的商业变革和创新。
公司继续秉承积极务实的精神，以“品牌源自实力、服务创造价值”为宗旨，一直致力于智慧城市、智慧校园、智慧社区、智慧景区、智慧交通、智慧医疗、智慧物流、智慧政务的建设。“成吉思智能”定会一路前行，为创造一个健康绿色的城市而不懈努力，让你我未来生活更精彩。

岗位介绍

一、智能化技术员（10-12名）
4000-5000元/月
广西区内外/本科或以上学历
需求专业：
计算机、通信、智能化或相关专业
岗位描述：
1、具有计算机网络、安防、智能小区等系统安装、调试、维护能力；
2、精通弱电系统、掌握电工知识，有电工证者优先考虑；
3、具备良好的身体素质和心理素质，具有较强的学习能力；
4、很强的责任心和上进心，能吃苦，富有团队精神。
岗位要求:
1、本科或以上学历，男性；
2、能适应长期出差或驻外。

二、弱电设计员（5-6名）
3500-4500元/月
广西区/本科或以上学历
需求专业：
电子、工程、设计或相关专业
岗位描述：
1、负责智能化各系统工程项目的现场勘察；
2、负责与甲方沟通、出图、设计方案；
3、工程项目的管理，进度监督考核；
4、领导交办的其他工作。
岗位要求:
1、本科或以上学历，男性；
2、应届毕业生即可，有弱电工程工作经验者优先考虑；
3、熟练运用AutoCAD、天正电气以及常用办公软件；
4、有较强的自学和克服困难的毅力，良好的人际关系；
5、能适应长期出差或驻外。

三、项目资料员（2-3名）
3000-4000元/月
广西区/大专或以上学历
需求专业：
工程管理、工程造价或相关专业
岗位描述：
1、负责收集、分析市场信息，加强对工程资料的现代化管理；
2、负责收集、整理工程施工各类图纸以及补充资料，做好工程资料收发、运转、管理等工作，做到生产管理，做好文件资料管理规范、完整；
3、掌握施工技术质量资料的归档要求，积极参与施工生产管理，做好资料的管理和监控；
4、做好工程图纸的收发和审核，对工程资料和图纸等进行独立组合案卷和归档；
5、处理好各项公共关系，包括与业主、项目经理、技术主管，上级主管部门以及其他相关部门的关系，同时还要处理好与档案管理部门的关系。
岗位要求：
1、大专或以上学历，男女不限；
2、能适应长期出差或驻外。

四、预算员（2-3名）
3000-5000元/月
广西区/大专或以上学历
需求专业：
工程管理、工程造价或相关专业
岗位描述：
1、完成工程项目的预结算工作；
2、熟悉安装、市政专业预结算；
3、能吃苦耐劳，执行力和协作力强；
4、有相关资格证件优先考虑。
岗位要求：
1、大专或以上学历，男性；
2、能适应长期出差或驻外。
五、材料采购员（2-3名）
3000-4000元/月
桂林市/大专或以上学历
需求专业：
材料、采购、物流或相关专业
岗位描述：
1、负责智能化相关厂家询价、谈判；
2、负责整理询价结果会签，汇报公司；
3、配合财务部负责采购材料发票取得；
4、配合工程项目采购；
5、品行端正，工作责任心强，能够吃苦耐劳，具备坚持不懈的精神和有一定的沟通组织协调能力；
岗位要求：
1、大专或以上学历，男女不限；
2、熟悉操作金碟软件，有建筑安装项目采购工作经验者优先；
3、能适应出差。

六、系统集成工程师（3-4名）
5000-6000元/月/
广西区/本科或以上学历
需求专业：
计算机、电气、通信工程或相关专业
岗位描述：
1、熟悉面向对象模式的软件开发；
2、具有系统项目集成经验，计算机网络系统等均有较深入的了解和实际操作经验；
3、熟练使用JavaScript、Ajax、HTML5、DIV/CSS等前端技术，能熟练使用常用框架如jQuery，有开发经验者优先；
4、熟练使用至少一种主流数据库，熟练掌握SQL，对数据库的管理、优化有较深的了解；
5、有一定的分析设计能力，具有相应的研发文档编写经验，能完成详细设计文档；
6、有良好的JAVA基础、熟练掌握Eclipse等常用开发工具；
7、熟悉掌握JSP、Servlet等Web开发相关技术；
8、熟悉使用struts、spring、hibernate等主流常用开发框架；
9、有较强的沟通和学习能力，积极主动、有工作责任心和团队合作意识，能承受一定工作压力。
岗位要求:
1、本科或以上学历，男性；
2、能适应长期出差或驻外。

七、网络工程师（5-6名）
4000-5000元/月
广西区/本科或以上学历
需求专业：
计算机、通信、网络工程或相关专业
岗位描述：
1、掌握网络基础理论知识，深入理解各类路由交换协议；
2、能熟练掌握Cisco、H3C等主流网络设备的规划配置；
3、了解网络安全防护体系知识，熟悉主流防火墙设备安全策略的配置与维护；
4、熟悉常用的网络管理软件，具有较强的网络维护及故障排查分析能力；
5、具有较强的沟通表达能力、文档编写能力及良好的团队合作精神。
岗位要求：
1、本科或以上学历，男性；
2、能适应长期出差或驻外。

八、数据库工程师（5-6名）
4000-5000元/月
广西区/本科或以上学历
需求专业：
计算机、电子信息工程或相关专业
岗位描述：
1、掌握数据库技术的基本概念、原理、方法和技术,能够使用SQL语言实现数据库操作；
2、能独立安装配置基于各种操作系统平台的oracle数据库，熟悉基于数据库的容灾备份技术；
3、了解数据库技术的最新发展，熟悉Oracle rac、dataguard及oracle 11g 新特性；
4、掌握数据库管理、维护及性能调优的基本技能，熟练使用常见的数据库监控、调优工具和数据复制工具；
5、具有较强的沟通表达能力、文档编写能力及良好的团队合作精神。
岗位要求：
1、本科或以上学历，男性；
2、能适应长期出差或驻外。

九、会计（1-2名）
3000-4000元/月
南宁市/大专或以上学历
需求专业：
会计或相关专业
岗位描述：
1、熟悉会计及税务工作流程，能够独立做帐；
2、负责公司工程项目的帐务处理；
3、认真细致、爱岗敬业、吃苦耐劳、有良好的职业操守；
4、思维敏捷、接受能力强、能独立思考、善于总结工作经验；
岗位要求：
1、大专或以上学历，女性；
2、熟练应用财务及办公软件，对金蝶等财务系统有实际操作者优先；
3、工作地点南宁市。

十、招投标专员（1-2名）
3000-4000元/月
广西区/大专或以上学历
需求专业：
市场营销、文秘或相关专业
岗位描述：
1、负责收集各招标、采购网站关于公司业务范围内的信息并及时报送公司、部门领导；
2、负责编制投标文件，根据公司最终意见进行修改、补充直至最后定稿、装订、密封；
3、影印、打印相关文稿；收集、整理、归档招投标文件、资料；
4、熟练掌握及运用word、excel、ppt等办公软件；
5、责任心强，工作细致，有良好的沟通、协调能力；
6、完成公司领导临时交办的任务。
岗位要求：
1、大专或以上学历，男女不限；
2、有投标文件编制工作经验；
3、能适应长期出差或驻外。

十一、行政助理（2-3名）
2500-3500元/月
桂林市/大专或以上学历
需求专业：
工商管理、市场营销、文秘或相关专业
岗位描述：
1、协助整理公司经营部投标文件，以及投标工作；
2、兼做讲解员，为公司研发中心展厅做讲解；
3、负责贵宾接待工作，有一定的沟通及应对能力；
4、计算机运用能力熟练，对办公软件得心应手。
岗位要求：
1、大专或以上学历，女性；
2、形象气质佳，善于学习和创新；
3、能适应出差。

福利待遇：
1、双休，五险，提供免费工作餐；
2、带薪年假、年终奖金、绩效奖金；
3、生日福利、节日福利；
4、差旅费补贴、员工旅游、员工培训。

联系方式：
联 系 人：蒋先生
联系电话：13317631133
办公电话：0773-2187831
联系邮箱：77507907@qq.com
联系地址：广西桂林市、七星区、信息产业园D14-2号楼
'''


def sent_tokenize(doc):
    return re.split(r'。|\n', doc.decode('utf-8'))


def word_tokenize(sent):
    if type(sent) != list:
        return []
    a = [pseg.cut(s) for s in sent]
    return [[(w, t) for w, t in cut] for cut in a]

# a = sent_tokenize(f)
# sents = word_tokenize(a)
#
# grammar = "CHUNK: {<nn><x><m>+<x><m>}"
# cp = nltk.RegexpParser(grammar)
# res = [cp.parse(sent) for sent in sents]
#
# print res

# a = "/".join(jieba.cut(f, ))
# print a

from nltk.tokenize import StanfordSegmenter
from nltk.tag import StanfordNERTagger

segmenter = StanfordSegmenter(
        path_to_sihan_corpora_dict="/home/rany/bin/stanford/segmenter/data/",
        path_to_model="/home/rany/bin/stanford/segmenter/data/pku.gz",
        path_to_dict="/home/rany/bin/stanford/segmenter/data/dict-chris6.ser.gz"
)
res = segmenter.segment(u"北海已成为中国对外开放中升起的一颗明星，2016年12月 12:12。")
print res.encode('utf-8')

chi_tagger = StanfordNERTagger('chinese.misc.distsim.crf.ser.gz')
sent = res
# for word, tag in  chi_tagger.tag(sent.split()):
#         print word.encode('utf-8'), tag
sent = chi_tagger.tag(sent.split())